大语言模型技术进展及应用丨TF105回顾
2023年5月25日,CCF TF 第105期活动“大语言模型技术进展及应用”在线成功举行。中科院自动化所研究员张家俊、北京语言大学高级翻译学院笔译系主任韩林涛、百度智能云技术委员会联席主席孙珂,三位讲者重点聚焦大语言模型的多语言翻译能力、基于大模型的辅助翻译工具开发实践以及大规模应用探索, 与听众一起探讨和分享了自己的思考。
5月25日,CCF TF105期活动邀请到中科院自动化所研究员张家俊、北京语言大学高级翻译学院笔译系主任韩林涛、百度智能云技术委员会联席主席孙珂,重点聚焦大语言模型的多语言翻译能力、基于大模型的辅助翻译工具开发实践以及大规模应用探索这几方面,进行了分享,解答了听众疑惑。
本次活动由于CCF TF算法与AI SIG主席何中军主持。
《大语言模型与多语言翻译》
张家俊首先回顾了机器翻译的发展历程以及大模型技术的发展。分析发现,大模型表现出很强的机器翻译能力,给机器翻译注入新的活力。然而,目前公开的大语言模型在多语言方面还存在不足,支持的语言数量较少,限制了大语言模型在多语言翻译上的潜力。针对这一问题,张家俊研究团队在开源模型LLaMA基础上,拓展其多语言翻译能力,研发了BigTrans模型并与主流的翻译系统进行了比较。报告进一步分析了机器翻译的评价指标,以BLEU为代表的传统客观评价指标已难以很好地评价当前基于大语言模型的机器翻译系统,亟需设计更贴合人类偏好的评价指标。
《基于大语言模型的计算机辅助翻译(CAT)工具开发实践》
韩林涛详细介绍了基于大语言模型的计算机辅助翻译(CAT)工具开发实践。大语言模型降低了开发门槛,使得无需深入学习编程知识也可以在此基础上进行开发。传统CAT工具用于提升翻译效率和翻译质量,然而在易用性、灵活性上存在诸多挑战。大模型技术的出现使得计算机辅助翻译工具研发进入了新的阶段。韩林涛结合自身实践,基于大模型API与人工翻译流程相结合开发更加智能更加便捷的计算机辅助翻译工具paratrans,展示了术语融合、翻译记忆等丰富易用的功能。最后,韩林涛展望了大语言模型技术在语言服务行业的应用。
《生成式大模型时代的应用探索》
孙珂结合百度大语言模型“文心一言”,介绍了百度在人工智能领域的业务布局、最新研究进展、以及应用落地。当前,大语言模型采用生成式模型的路线,引入了提示学习、人类反馈强化学习等机制,在语言理解、生成能力方面显示了强大能力。“文心一言”进一步融合了知识增强、检索增强、对话增强等特色技术。孙珂展示了“文心一言”在推理能力、数据分析、数据智能、对话搜索等方面的应用,并展望了广泛的落地应用场景。
互动提问环节,参会观众对于大模型微调时遗忘以前的推理能力、大语言模型针对上下文强逻辑关联的语义生成的可行性、大模型应用于垂直领域等话题提出了疑问,三位嘉宾也分别进行了详细的解答讨论。
活动最后,何中军总结到,大模型技术日新月异,能参与到这个激动人心的技术浪潮中,我们都是幸运的,希望本次活动能够给听众带来更多的启发和思考,促进技术的发展。
本期精彩回顾视频可在CCF数字图书馆观看,欢迎持续关注TF更多精彩活动!
关于CCF TF
CCF TF技术前线(Tech Frontier)创立于2017年6月,旨在为工程师提供顶级交流平台,更好地服务企业界计算机专业人士,帮助企业界专业技术人士职业发展,通过搭建平台实现常态化合作和发展,促进企业间、学术界与企业间技术交流。目前已组建知识图谱、数据科学、智能制造、架构、安全、智能设备与交互、数字化转型与企业架构、算法与AI、智能前端、工程师文化、研发效能、软件质量工程等十二个SIG(Special Interest Group),提供丰富的技术前线内容分享。2023年全年,CCF TF将在线开展20场活动,会员免费参加。
加入CCF
加入CCF会员享受更多超值活动,为自己的技术成长做一次好投资。
点击链接了解更多会员权益:CCF个人会员权益 CCF公司会员权益
识别或扫码入会
欢迎关注CCFTF及CCF业务总部公众号,精彩陆续开启!
关注CCFTF获取TF活动资讯
关注CCF业务总部优惠预定会议场地
合作单位
CCF推荐
【精品文章】
点击“阅读原文”,回顾往期精彩视频!